AMD vydává Epyc 3. generace: rychlejší na jádro, na socket a často i na dva
Prezentace, kterou si připravili Lisa Su (CEO), Mark Papermaster (CTO), Forrest Norrod (šéf serverů) a Dan MacNamara (šéf obchodu se servery), by se dala rozdělit na dvě části. V první, byly představeny samotné procesory a jejich technologické novinky. Ve druhé následovaly střídavě grafy výkonu ve všem možném a vstupy zástupců partnerských firem, které buďto staví systémy na Epycu 3. generace, nebo pro něj připravují softwarová řešení.
Ze známých novinek architektury Zen 3 lze připomenout 19% nárůst IPC, nový návrh jádra a novou strukturu cache. Z těch méně známých AMD k příležitosti Epycu zmínila zdvojnásobený výkon při výpočtech ve formátu INT8 (využitelné v AI / Inference) a dále podporu zcela nových zabezpečovacích prvků, jako například hardwarového zabezpečení na úrovni virtuálního stroje - pro paměť každého virtuálního stroje zvlášť.
Zatímco v kontextu desktopu, kde většina systémů využívá Windows a jejich zmatený scheduler, který nedělal dobře Zen 2, jsme o L3 monolitické v rámci křemíkového jádra (tedy pro až osm jader procesorových) hovořili jakožto o zlepšení, které se projeví nejvíce tam, kde scheduler Windows škodí. To se serverů sice netýká, nicméně i některých serverovým úlohám přináší přepracovaná L3 cache podstatné výhody:
Jde zejména o situace, kdy procesorová jádra používají jak data, která jsou pro všechna sdílená, tak data, která jsou unikátní pro jádro. Zatímco Zen 2 - přestože měl stejnou fyzickou kapacitu L3 cache - musel sdílená data sdílet v každé polovině L3 cache a na unikátní data tím zbývalo méně prostoru, stačí Zen 3 sdílená data držet v L3 cache jednou a v důsledku zbývá více prostoru pro data unikátní (na příkladu ilustrovaném ve slajdu výše je to o 50 % více).
Oficiální přehled modelů potvrzuje i existenci krátce před vydáním objevivších se 28- a 56jádrových modelů, které - počtem jader - jako by z oka vypadly Xeonům Intelu. Toto symbolické poškádlení se tedy koná, jen jejich parametry jsou nakonec nepatrně odlišné. V případě Epyc 7663 je základní takt o 100 MHz nižší, než se uvádělo, v případě Epyc 7453 je pro změnu základní takt o stovky MHz vyšší, ovšem L3 cache je „pouze“ 64MB (ty uvozovky proto, že Intel Xeon Gold 6258R disponuje 38,5 MB).
Epyc | jád. / vlák. | takt | cache | TDP | cena |
---|---|---|---|---|---|
7763 | 64 / 128 | 2,45 / 3,50 GHz | 256 MB | 280W | $7890 |
7H12 | 64 / 128 | 2,60 / 3,30 GHz | 256 MB | 280W | ? |
7713(P) | 64 / 128 | 2,00 / 3,68 GHz | 256 MB | 225W | $7060 / $5010 |
7742 | 64 / 128 | 2,25 / 3,40 GHz | 256 MB | 225W | $6950 |
7702(P) | 64 / 128 | 2,00 / 3,35 GHz | 256 MB | 200W | $6450 / $4425 |
7663 | 56 / 112 | 2,00 / 3,50 GHz | 256 MB | 225 W | $6366 |
7662 | 64 / 128 | 2,00 / 3,30 GHz | 256 MB | 225W | ? |
7643 | 48 / 96 | 2,30 / 3,60 GHz | 256 MB | 225W | $4995 |
7642 | 48 / 96 | 2,30 / 3,30 GHz | 192 MB | 225W | $4775 |
7552 | 48 / 96 | 2,20 / 3,30 GHz | 192 MB | 200W | $4025 |
75F3 | 32 / 64 | 2,95 / 4,00 GHz | 256 MB | 280W | $4860 |
7543(P) | 32 / 64 | 2,80 / 3,70 GHz | 256 MB | 225W | $3761 / $2730 |
7542 | 32 / 64 | 2,90 / 3,40 GHz | 128 MB | 225W | $3400 |
7513 | 32 / 64 | 2,60 / 3,65 GHz | 128 MB | 200W | $2840 |
7532 | 32 / 64 | 2,40 / 3,30 GHz | 256 MB | 200W | ? |
7502(P) | 32 / 64 | 2,50 / 3,35 GHz | 128 MB | 180W | $2600 / $2300 |
7453 | 28 / 56 | 2,75 / 3,45 GHz | 64MB | 225W | $1570 |
7452 | 32 / 64 | 2,35 / 3,35 GHz | 128 MB | 155W | $2025 |
74F3 | 24 / 48 | 3,20 / 4,00 GHz | 256 MB | 240W | $2900 |
7F72 | 24 / 48 | 3,20 / 3,70 GHz | 192 MB | 240W | $2450 |
7443(P) | 24 / 48 | 2,80 / 4,00 GHz | 128 MB | 200W | $2010 / $1337 |
7413 | 24 / 48 | 2,65 / 3,60 GHz | 128 MB | 180W | $1825 |
7402(P) | 24 / 48 | 2,80 / 3,35 GHz | 128 MB | 180W | $1783 / $1250 |
7352 | 24 / 48 | 2,30 / 3,20 GHz | 128 MB | 155W | $1350 |
73F3 | 16 / 32 | 3,50 / 4,00 GHz | 256 MB | 240W | $3521 |
7F52 | 16 / 32 | 3,50 / 3,90 GHz | 256 MB | 240W | $3100 |
7343 | 16 / 32 | 3,20 / 3,90 GHz | 128 MB | 190W | $1565 |
7313(P) | 16 / 32 | 3,00 / 3,70 GHz | 128 MB | 155W | $1083 / $913 |
7302(P) | 16 / 32 | 3,00 / 3,30 GHz | 128 MB | 155W | $978 / $825 |
7282 | 16 / 32 | 2,80 / 3,20 GHz | 64 MB | 120W | $650 |
7272 | 12 / 24 | 2,90 / 3,20 GHz | 64 MB | 120W | $625 |
72F3 | 8 / 16 | 3,70 / 4,10 GHz | 256 MB | 180W | $2468 |
7F32 | 8 / 16 | 3,70 / 3,90 GHz | 128 MB | 180W | $2100 |
7262 | 8 / 16 | 3,20 / 3,40 GHz | 64 MB | 155W | $575 |
7252 | 8 / 16 | 3,10 / 3,20 GHz | 64 MB | 120W | $475 |
7232P | 8 / 16 | 3,10 / 3,20 GHz | 32 MB | 120W | $450 |
S ohledem na počty jader, takty a doporučené ceny lze říct, že nové modely nabídnou i z hlediska poměru cena / výkon posun oproti předchozí generaci, takže ani s ohledem na stávající omezenou dostupnost výrobních kapacit nelze říct, že by AMD nějak napálila ceny. Ceny jsou úměrné nárůstu plochy 7nm křemíku, přičemž nárůst výkonu bude pro mnoho modelů vyšší než nárůst ceny.
Následují výsledky testů, které AMD zveřejnila. Většinou ve srovnání koncipovaném jako nejvýkonnější dvousocketové řešení jedné i druhé značky. Protože to často vychází pro AMD až moc dobře, zařadila i test, kde vyjadřuje výsledek ve výkonu na jádro. Je proto potřeba sledovat popisky, co konkrétní graf vyjadřuje. Spektrum oborů je velmi široké, od HPC, přes Cloud, Enterprise segment, fyzikální simulace, databáze, datová analytika…
Asi nemá smysl rozebírat všechny partnerské firmy a co jejich zástupci řekli nebo pochválili, nejzajímavější a pro společnost z letošního hlediska klíčové jsou tři velké zakázky:
- LUMI, největší superpočítač Evropy
- největší superpočítač Austrálie ve výpočetním středisku PAWSEY
- Frontier - první superpočítač E(xa)FLOPS éry přesahující 1,5 EFLOPS, koncem roku
Tyto systémy budou postavené na procesorech Epyc 3. generace v kombinaci s „příští generací“ akcelerátorů Instinct. Tím AMD nepřímo potvrzuje, že k vydání Instinct MI200 s čipletovým jádrem Aldebaran skutečně dojde v letošním roce, jak začalo počátkem března prosakovat. Více:
- AMD Instinct MI200: Čiplety, VCN 2.6, full-rate FP64, HBM2E, perf_determinism
- Aldebaran / Instinct MI200 je čipletový, dual-GPU karta vyloučena
Instinct MI200 nebude mít podobu PCIe karty (alespoň ne ve verzích pro většinu zmíněných systémů), ale využije otevřeného standardu OAM.
Pokud jde o cloud, oznámila Lisa Su, že na procesorech Epyc první a druhé generace dohromady aktuálně běží něco přes 200 cloudových instancí po celém světě. Su očekává, že s ohledem na zakázky počítající s procesory Epyc třetí generace s počet těchto instancí do konce letošního roku zdvojnásobí a překoná 400, jiný slovy že Epyc 3. generace bude mít během tří kvartálů takový tah na bránu, jako první dvě generace od poloviny roku 2017, tedy za 15 kvartálů jejich existence.
AMD